LVS、Nginx、HaProxy 优缺点

        搭建负载均衡高可用环境相对简单,主要是要理解其中原理。此文描述了三种负载均衡器的优缺点,以便在实际的生产应用中,按需求取舍。

        目前,在线上环境中应用较多的负载均衡器硬件有F5 BIG-IP,软件有LVS,Nginx及HAProxy,高可用软件有Heartbeat、Keepalived,成熟的架构有LVS+Keepalived、Nginx+Keepalived、HAProxy+keepalived及DRBD+Heartbeat.

三种负载均衡器的优缺点说明如下:

LVS

LVS的优点:

  1. 抗负载能力强、工作在第4层仅作分发之用,没有流量的产生,这个特点也决定了它在负载均衡软件里的性能最强的;无流量,同时保证了均衡器IO的性能不会受到大流量的影响;
  2. 工作稳定,自身有完整的双机热备方案,如LVS+Keepalived和LVS+Heartbeat;
  3. 应用范围比较广,可以对所有应用做负载均衡;
  4. 配置性比较低,这是一个缺点也是一个优点,因为没有可太多配置的东西,所以并不需要太多接触,大大减少了人为出错的几率;

LVS的缺点:

  1. 软件本身不支持正则处理,不能做动静分离,这就凸显了Nginx/HAProxy+Keepalived的优势。
  2. 如果网站应用比较庞大,LVS/DR+Keepalived就比较复杂了,特别是后面有Windows Server应用的机器,实施及配置还有维护过程就比较麻烦,相对而言,Nginx/HAProxy+Keepalived就简单多了。

  • LVS/DR如何处理请求报文的,会修改IP包内容吗?
    • vs/dr本身不会关心IP层以上的信息,即使是端口号也是tcp/ip协议栈去判断是否正确,vs/dr本身主要做这么几个事:
      • 接收client的请求,根据你设定的负载均衡算法选取一台realserver的ip;
      • 以选取的这个ip对应的mac地址作为目标mac,然后重新将IP包封装成帧转发给这台RS;
      • 在hash table中记录连接信息。

        vs/dr做的事情很少,也很简单,所以它的效率很高,不比硬件负载均衡设备差多少。

        数据包、数据帧的大致流向是这样的:client –> VS –> RS –> client

- 前面已作了回答,vs/dr不会修改IP包的内容.
  • RealServer为什么要在lo接口上配置VIP?在出口网卡上配置VIP可以吗?
    • 既然要让RS能够处理目标地址为vip的IP包,首先必须要让RS能接收到这个包。

        在lo上配置vip能够完成接收包并将结果返回client。

- 答案是不可以将VIP设置在出口网卡上,否则会响应客户端的arp request,造成client/gateway arp table紊乱,以至于整个load balance都不能正常工作。
  • RealServer为什么要抑制arp帧?
            这个问题在上一问题中已经作了说明,这里结合实施命令进一步阐述。我们在具体实施部署的时候都会作如下调整:
1
2
3
4
echo "1" >/proc/sys/net/ipv4/conf/lo/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/lo/arp_announce
echo "1" >/proc/sys/net/ipv4/conf/all/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/all/arp_announce

        相信很多人都不会弄懂它们的作用是什么,只知道一定得有。我这里也不打算拿出来详细讨论,只是作几点说明,就当是补充吧。

1
2
echo "1" >/proc/sys/net/ipv4/conf/lo/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/lo/arp_announce

        这两条是可以不用的,因为arp对逻辑接口没有意义。

  • 如果你的RS的外部网络接口是eth0,那么
1
2
echo "1" >/proc/sys/net/ipv4/conf/all/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/all/arp_announce

        其实真正要执行的是:

1
2
echo "1" >/proc/sys/net/ipv4/conf/eth0/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/eth0/arp_announce

        所以我个人建议把上面两条也加到你的脚本里去,因为万一系统里上面两条默认的值不是0,那有可能是会出问题滴。

  • LVS/DR load balancer(director)与RS为什么要在同一网段中?
    从第一个问题中大家应该明白vs/dr是如何将请求转发给RS的了吧?它是在数据链路层来实现的,所以director必须和RS在同一网段里面。
  • 为什么director上lo接口除了VIP另外还要在eth0配一个ip(即DIP)?
    • 如果是用了keepalived等工具做HA或者Load Balance,则在健康检查时需要用到DIP。
    • 没有健康检查机制的HA或者Load Balance则没有存在的实际意义。
  • LVS/DR ip_forward需要开启吗?
    不需要。因为director跟realserver是同一个网段,无需开启转发。
  • director的vip的netmask一定要是255.255.255.255吗?
    lvs/dr里,director的vip的netmask 没必要设置为255.255.255.255,也不需要再去
    route add -host $VIP dev eth0:0
    director的vip本来就是要像正常的ip地址一样对外通告的,不要搞得这么特殊.
  • LVS/DR如何进行tcp的三次握手?

Nginx

Nginx的优点:

  1. 工作在OSI第7层,可以针对http应用做一些分流的策略。比如针对域名、目录结构。它的正则比HAProxy更为强大和灵活;
  2. Nginx对网络的依赖非常小,理论上能ping通就就能进行负载功能,这个也是它的优势所在;
  3. Nginx安装和配置比较简单,测试起来比较方便;
  4. 可以承担高的负载压力且稳定,一般能支撑超过几万次的并发量;
  5. Nginx可以通过端口检测到服务器内部的故障,比如根据服务器处理网页返回的状态码、超时等等,并且会把返回错误的请求重新提交到另一个节点;
  6. Nginx不仅仅是一款优秀的负载均衡器/反向代理软件,它同时也是功能强大的Web应用服务器。LNMP现在也是非常流行的web环境,大有和LAMP环境分庭抗礼之势,Nginx在处理静态页面、特别是抗高并发方面相对apache有优势;
  7. Nginx现在作为Web反向加速缓存越来越成熟了,速度比传统的Squid服务器更快,有需求的朋友可以考虑用其作为反向代理加速器;

Nginx的缺点:

  1. Nginx不支持url来检测。
  2. Nginx仅能支持http和Email,这个它的弱势。
  3. Nginx的Session的保持,Cookie的引导能力相对欠缺。

HaProxy

HAProxy的优点:

  1. HAProxy是支持虚拟主机的,可以工作在4、7层(支持多网段);
  2. 能够补充Nginx的一些缺点比如Session的保持,Cookie的引导等工作;
  3. 支持url检测后端的服务器;
  4. 它跟LVS一样,本身仅仅就只是一款负载均衡软件;单纯从效率上来讲HAProxy更会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的;
  5. HAProxy可以对Mysql读进行负载均衡,对后端的MySQL节点进行检测和负载均衡,不过在后端的MySQL slaves数量超过10台时性能不如LVS;
  6. HAProxy的算法较多,达到8种;